1
CUDA 核心開發基礎
AI021Lesson 2
00:00

CUDA 核心開發始於定義一個 核心,這是一種專為在具備龐大核心數量的 NVIDIA GPUC++ 函數,可並行執行。這些函數是 CUDA 程式設計模型中的基本工作單位,扮演著串列主機邏輯轉換為大量平行設備執行的橋樑。

1. __global__ 修飾符

這個 __global__ 宣告修飾符是必須的 API 修飾符,它會指示編譯器為 GPU 產生程式碼,同時讓函數入口點對 CPU 保持可見。 可在 GPU 上執行且能由主機呼叫的函數稱為核心。

2. 執行環境

核心被分派至並在 串流多處理器(SM)上執行。SM 是 NVIDIA GPU 內的主要計算引擎,負責管理數百個並行執行的線程。每個 SM 處理線程區塊,並將其排程至處理核心。

語法規則: 核心必須嚴格地返回 void。由於它們與主機非同步運作,無法直接將值回傳給 CPU;必須將結果寫回到已配置的裝置記憶體中。

主機(CPU)裝置(NVIDIA GPU)串流多處理器(SM)核心啟動
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>